clockbench

人工智能的盲点:世界顶级大模型在读取识别模拟时钟时间表现惨淡

当今最先进的人工智能模型能够在数学奥林匹克竞赛中夺得金牌,编程能力超越绝大多数专业开发者,却在一个看似简单的任务上遭遇滑铁卢——读取模拟时钟。一项名为ClockBench的新基准测试揭示了人工智能领域的一个令人尴尬的现实:即使是最前沿的AI系统,在这项六岁儿童

模型 人工智能 盲点 时钟 clockbench 2025-09-09 01:58  2